庄园教授:一种基于机器学习和样本差异的通用Wi-Fi指纹定位方法| SANA佳文速递
标题:一种基于机器学习和样本差异的通用Wi-Fi指纹定位方法
作者:曹晓祥,庄园,杨先圣,孙骁,王轩
主题词:指纹定位;样本差异;二分类;提升方法;机器学习;WiFi定位
(图片来自作者)
Satellite Navigation (2021) 2: 27
引用文章:
Cao, X. X., Zhuang, Y., Yang, X. S. et al. A universal Wi-Fi fingerprint localization method based on machine learning and sample differences. Satell Navig 2, 27 (2021). https://doi.org/10.1186/s43020-021-00058-8.
PDF文件下载链接:
https://satellite-navigation.springeropen.com/articles/10.1186/s43020-021-00058-8
-长按识别二维码查看/下载全文-WiFi:Fingerprint-based Positioning Using Machine Learning
The Wi-Fi fingerprint-based positioning is widely used because of its ready hardware and acceptable accuracy, especially using the Machine Learning (ML) and Deep Learning (DL). The authors deeply studied for solving two majorproblems:
1. The traditional ML-based method faces the problem of small sample learning and small number of features, we use the differences between samples to calculate new classification features, and use the binary classification algorithm to replace the multi-classification algorithm.
2. The proposed method greatly improves the model’s scene adaptability, the model trained by one building’s data can be well applied to another building, which shows strong generalizable ability. It provides a new idea for the fingerprint-based positioing model’s deployment and the management on the cloud, especially when there are a large amount of classification models.
本文亮点
1.使用样本间差异组成新的分类特征,将原本指纹匹配定位中多分类问题转化成二分类问题,如此既解决了多分类中面临的小样本学习问题,又为分类模型注入更多有效的特征。
2.使用基于样本差异训练而成的分类模型具备场景迁移能力,不同场景下训练的分类模型可以自由切换使用,传统的“一场景一模型”解决思路无法实现大规模的云端部署、应用,本文提出的通用模型为指纹匹配模型线上部署提供了新的思路。
内容简介
I.同现有方法的比较
由于UJIndoorLoc数据集被广泛用于测试指纹定位算法的性能,因此本文方法的结果与其他论文方法的结果进行了对比,如表1所示。从表中可以看出,本文提出的新方法不仅在定位误差方面有较好的表现,而且在建筑物和楼层判断准确率方面也有较好的表现。第一种方法采用XGBoost,平均定位误差为3.42m,楼层判断准确率高达99.40%。第二种方法采用GBDT,平均定位误差为2.45m,楼层判断准确率为99.14%。表 1 其他论文结果同本文方法的比较
II.同传统方法的性能比较
评估指标主要有三个:楼层判断准确率、点位识别准确率和平均定位误差。本文将多分类问题转化为二分类,树模型在二分类中表现良好。因此,本文选择决策树和集成学习算法EL(包括bagging算法和boosting算法)分别来评价所提方法的性能。bagging算法包括bagging和RF,boosting算法包括XGBoost和GBDT。
具体结果如表2所示。很明显,DT性能比EL差得多。而bagging算法的性能较boosting算法差。如表2所示,使用GBDT时定位精度略高。然而,XGBoost在楼层判断上表现更好。图1为不同算法的CDF。表 2 当训练数据和验证数据来自同一建筑物时,不同方法的性能比较
图 1 不同方法的CDF图
III.不同建筑物训练模型性能比较
本文方法的主要目的是提高分类器的适应能力,使一个建筑训练的分类器可以在另一个建筑中使用。利用三座不同建筑物的测试数据验证了该方法的有效性下表记录了楼层判断准确率和点位识别准确率,以及平均定位误差。分别对DT算法、bagging算法和boosting算法的性能进行了测试。很明显本文方法优于其他方法,即使数据来自不同的建筑物,该方法仍表现良好。表3、4、5为各建筑的结果,图2、3、4为各方法的CDF。表 3 使用XGBoost时不同分类器和不同测试数据的结果
表 4 使用bagging算法时不同分类器和不同测试数据的结果
表 5 使用DT算法时不同分类器和不同测试数据的结果
图 2 建筑物0使用传统方法和本文提出方法的CDF图
图 3 建筑物1使用传统方法和本文提出方法的CDF图
图 4 建筑物2使用传统方法和本文提出方法的CDF图
IV.删除评分低特征后的性能分析
选取了23个特征来测试测试本文提出方法。表6和图8显示了使用23个特征训练的分类器的结果。为了测试特征对分类器性能,我们将特征的数量进一步增加至57个,表6显示了它的性能。表 6 使用 23个特征时XGBoost和GBDT对测试数据的性能比较
当使用XGBoost和GBDT时,训练后可输出每个特征的得分。为了提高分类器的准确率,图5、6、7给出了每个特征的评分,但其中不同分类器的低评分特征是不同的。因此,我们将一些常见的低评分特征删除。利用剩下的特征来训练新的分类器,并对新分类器的性能进行测试。
图 7 使用来自Building2的数据训练模型得到的每个特征的得分
表 7 删除低评分特征后使用XGBoost和GBDT时不同测试样本的测试结果
图 8 使用部分特征时传统方法和本文提出方法的CDF图
图 9 删除部分特征时传统方法和本文提出方法的CDF图
作者简介
庄园 教授
庄园,入选国家级人才计划青年项目,武汉大学测绘遥感信息工程国家重点实验室教授,博士生导师。2015年获加拿大卡尔加里大学博士,之后分别在加拿大、美国从事研发工作。主要研究方向涵盖多传感器融合定位、导航与感知,物联网、车联网传感器应用(识别、通信、定位与检测),低功耗定位导航芯片与终端。在IEEE COMST、TMC、IOTJ、TVT、TITS、TWC、TAES、JSSCC、AAAI、IJCAI等行业核心期刊和会议上发表论文80余篇,其中第一、通讯作者SCI期刊论文30余篇;谷歌学术引用2000余次,H-index指数25。担任IEEEIoT J.和Satell Navig专刊编辑,20+ SCI期刊审稿人。曾获ION GNSS+最佳论文奖、中国卫星导航年会最佳论文奖、IEEE世界室内定位竞赛手机组冠军等10余项学术奖励。开发的物联网定位与故障检测系统大规模使用在梅奥诊所、凯撒医疗、谷歌、思科等国际知名机构中。获批专利11项(含美国专利3项),转让3项核心专利及1项IP。
中文主页(点击浏览):
http://jszy.whu.edu.cn/zhuangyuan/zh_CN/index.htm
Researchgate主页(点击浏览):
https://www.researchgate.net/profile/Yuan_Zhuang11
撰稿:曹晓祥
编辑:星航
审校:庄教授
推荐阅读
徐元博士:面向有色测量噪声下UWB/INS组合行人导航的分布式卡尔曼滤波| SANA佳文速递
[综述]| 面向室内的导航定位--现状和未来趋势| 李由
编委报告| 陈锐志:高精度室内定位技术及其应用
编委报告| 牛小骥:从外在信号环境和内在感知能力看手机室内定位的可行性
重磅!SatNav“室内导航”专刊开始征文
关于我们
《卫星导航(英文)》(Satellite Navigation)创办于2020年,ESCI收录,是中国科学院空天信息创新研究院主办的英文学术期刊,主编是杨元喜院士,主要报道卫星导航相关的最新高水平科研成果与综述文章及通讯,在 Springer Nature开放获取(open access)出版。可免费获取全文,欢迎关注和投稿。
Website:http://satellite-navigation.springeropen.com/
E-mail:editorial_office@sana.org.cn/ satellite-navigation@aircas.ac.cn
Tel:86-10-58887063长按二维码关注我们
期刊新媒体传播矩阵